大多数用于点击速率(CTR)预测的现有方法取决于超薄的假设,即点击概率是观察概率和相关概率的乘积。但是,由于这两个概率之间存在复杂相互作用,因此这些方法不能应用于其他场景,例如,查询自动完成(QAC)和路由推荐。我们提出了一般的脱结框架,而无需简化变量之间的关系,可以处理CTR预测中的所有场景。仿真实验表明:在最简单的情况下,我们的方法与最先进的方法保持了类似的AUC;在其他情况下,与现有方法相比,我们的方法实现了相当大的改进。同时,在网上实验中,框架也始终如一地提高了显着的改进。
translated by 谷歌翻译
深度加强学习(DRL)在复杂的视频游戏中取得了超级性能(例如,星际争霸II和DOTA II)。然而,目前的DRL系统仍然遭受多助手协调,稀疏奖励,随机环境等的挑战。在寻求解决这些挑战时,我们雇用了足球视频游戏,例如Google Research Football(GRF),如我们测试的开发基于端到端的学习的AI系统(表示为Tickick)以完成此具有挑战性的任务。在这项工作中,我们首先从联赛培训获得的单一代理专家的自我播放中生成了一个大型重播数据集。然后,我们开发了一个分布式学习系统和新的离线算法,以从固定的单个代理数据集中学习一个强大的多辅助AI。据我们所知,Tickick是第一个基于学习的AI系统,可以接管多个Agent Google Research Footful Game,而以前的工作可以控制单一代理或实验玩具学术情景。广泛的实验进一步表明,我们的预先训练的模型可以加速现代多功能算法的训练过程,我们的方法在各种学术方案上实现了最先进的性能。
translated by 谷歌翻译
In this work, we propose a self-supervised multi-agent system, termed a memory-like adaptive modeling multi-agent learning system (MAMMALS), that realizes online learning towards behavioral pattern clustering tasks for time series. Encoding the visual behaviors as discrete time series(DTS), and training and modeling them in the multi-agent system with a bio-memory-like form. We finally implemented a fully decentralized multi-agent system design framework and completed its feasibility verification in a surveillance video application scenario on vehicle path clustering. In multi-agent learning, using learning methods designed for individual agents will typically perform poorly globally because of the behavior of ignoring the synergy between agents.
translated by 谷歌翻译
反向工程从其他表示形式进行的CAD形状是许多下游应用程序的重要几何处理步骤。在这项工作中,我们介绍了一种新型的神经网络体系结构,以解决这项具有挑战性的任务,并使用可编辑,受约束的棱镜CAD模型近似平滑的签名距离函数。在训练过程中,我们的方法通过将形状分解为一系列2D轮廓图像和1D包膜函数来重建体素空间中的输入几何形状。然后可以以不同的方式重新组合这些,以允许定义几何损失函数。在推断期间,我们通过首先搜索2D约束草图的数据库来获取CAD数据,以找到近似配置文件图像的曲线,然后将它们挤出并使用布尔操作来构建最终的CAD模型。我们的方法比其他方法更接近目标形状,并输出与现有CAD软件兼容的高度可编辑的约束参数草图。
translated by 谷歌翻译
视觉和听觉信息对于确定视频中的显着区域都是有价值的。深度卷积神经网络(CNN)展示了应对视听显着性预测任务的强大能力。由于各种因素,例如拍摄场景和天气,源训练数据和目标测试数据之间通常存在适度的分布差异。域差异导致CNN模型目标测试数据的性能降解。本文提前尝试解决视听显着性预测的无监督域适应问题。我们提出了一种双重域交流学习算法,以减轻源数据和目标数据之间的域差异。首先,建立了一个特定的域歧视分支,以对齐听觉功能分布。然后,这些听觉功能通过跨模式自我发项模块融合到视觉特征中。设计了其他域歧视分支,以减少视觉特征的域差异和融合视听特征所隐含的视听相关性的差异。公共基准测试的实验表明,我们的方法可以减轻域差异引起的性能降解。
translated by 谷歌翻译
在6G无线通信网络中,按需服务提供是一个至关重要的问题,因为新兴服务的需求大大不同,并且网络资源变得越来越异质和动态。在本文中,我们研究了按需无线资源编排问题,重点是编排决策过程的计算延迟。具体而言,我们将决策延迟延迟到优化问题。然后,提出了一个基于动态的神经网络(DYNN)的方法,可以根据服务要求调整模型复杂性。我们进一步建立一个知识库,代表服务需求之间的关系,可用的计算资源和资源分配绩效。通过利用知识,可以及时选择DYNN的宽度,从而进一步提高编排的性能。仿真结果表明,所提出的方案大大优于传统的静态神经网络,并且在按需服务提供方面也表现出足够的灵活性。
translated by 谷歌翻译
当一个用户将多个不同的任务卸载到边缘服务器时,任务调度是一个关键问题。当用户有多个任务要卸载,并且一次只能将一个任务传输到服务器,而服务器根据传输顺序处理任务时,问题是NP-HARD。但是,传统优化方法很难快速获得最佳解决方案,而基于强化学习面孔的方法和过度的动作空间和缓慢收敛的挑战。在本文中,我们提出了一种基于RL的Digital Twin(DT)辅助任务调度方法,以提高RL的性能和收敛性。我们使用DT来模拟代理商做出的不同决策的结果,以便一个代理可以一次尝试多个操作,或者类似地,多个代理可以在DT中并行与环境交互。通过这种方式,RL的勘探效率可以通过DT显着提高,因此RL可以更快地收敛,而局部最优性不太可能发生。特别是,设计了两种算法来制定任务调度决策,即DT辅助异步Q学习(DTAQL)和DT辅助探索Q-Learning(DTEQL)。仿真结果表明,两种算法都通过提高勘探效率显着提高了Q学习的收敛速度。
translated by 谷歌翻译
在自然语言处理中,广泛使用黑框模型为对决策基础的理解,预测结果的可信度以及改善模型性能带来了巨大挑战。文本样本中的单词具有反映其语义和上下文信息的属性,例如语音,位置等。这些属性可能与显着性一词具有一定的关系,这有助于研究模型的解释性预测。在本文中,我们探讨了“显着性”一词和属性一词之间的关系。根据分析结果,我们进一步建立了一个映射模型Seq2Sality,从文本样本中的单词及其属性到基于序列标记的概念的显着性值。此外,我们建立了一个名为PRSALM的新数据集,该数据集包含文本示例中的每个单词,单词属性和单词显着性值。进行实验评估以分析具有不同特性的单词的显着性。验证了SEQ2Sality模型的有效性。
translated by 谷歌翻译
射频和深度学习在自动胶质瘤分级中显示出很高的普及。辐射瘤可以提取手工制作的特征,定量描述胶质瘤等级的专家知识,深度学习在提取促进最终分类的大量高吞吐量功能方面是强大的。然而,随着它们的互补优势尚未充分调查和整合,仍然可以提高现有方法的性能。此外,通常需要病变图来进行测试阶段的最终预测,这是非常麻烦的。在本文中,我们提出了专业知识引导的几何表示学习(录音)框架。手工制作功能和学习特征的几何歧管构建为挖掘深度学习和辐射族之间的隐性关系,从而挖掘相互同意和胶质瘤等级的必要表现。通过专门设计的歧管差异测量,分级模型可以更有效地利用输入图像数据和专家知识,并在测试阶段摆脱病变分段图的要求。拟议的框架是关于要使用的深度学习架构的灵活性。已经评估了三种不同的架构,并比较了五种模型,表明我们的框架总能产生有前途的结果。
translated by 谷歌翻译
前列腺成像报告和数据系统(PI-RAD)基于多参数MRI类\ ^ EES患者分为5类(PI-RADS 1-5),用于常规临床诊断指导。但是,无论pi-rads 3患者是否应该经过活组织检查,都没有共识。这些硬样品(HS)的采矿功能对于医生来说是有意义的,以实现准确的诊断。目前,HS Biomarkers的采矿是Insu \`的,并且HS Biomarkers用于前列腺癌诊断的e \'助力性和稳健性尚未探讨。在这项研究中,构建了来自DI \'EERENT数据分布的生物标志物。结果表明,HS Biomarkers可以在DI \'EERENT数据分布中实现更好的性能。
translated by 谷歌翻译